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植物 DNA 条 形 码 研究 领域 文献 计量 学 及 可 视 化 分 析 " 
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摘 要 : 为 了 全 面 了 解 植物 DNA 条 形 码 研究 领域 的 发 展 和 最 新 动态 ,探讨 中 国 DNA 条 形 码 
发 展 的 状态 和 前 景 。 利用 Web of Science 数据 库 对 该 研究 领域 进行 文献 计量 学 统计 ，, 并 对 引 
] 频 次、 研究 热点 和 研究 前 沿 进 行 了 可 视 化 分 析 。 获 得 了 中 国 、 美 国 、 加 拿 大 学 者 在 该 领域 
文献 页 献 率 最 大 ， 中 国 研究 机 构 发 文 量 领 先 ， 但 美国 、 加 拿 大 科研 机 构 论 文 质量 较 高 ， 影 响 
力 较 大 。 文 献 引 用 频次 可 视 化 发 现 ，2009 年 是 该 领域 研究 的 高 峰 期 ， 该 研究 领域 的 前 沿 和 
研究 热点 主要 集中 在 物种 的 识别 和 生物 多 样 性 应 用 、DNA 条 形 码 候选 序列 筛选 和 鉴定 技术 
的 规范 化 。 中 国学 者 在 植物 DNA 条 形 码 领域 研究 具有 领军 作用 和 很 高 的 影响 力 ， 国 家 提倡 
中 药 产 业 的 发 展 也 推动 了 我 国 DNA AICI AR, (ACA A IRE BE 
国 、 加 拿 大 等 发 达 国 家 研究 还 有 一 定 的 差距 ,应 该 加 大 与 发 达 国家 科研 机 构 合 作 ， 提 高 研究 
能 力 ，DNA 条 形 码 技术 在 植物 的 鉴定 、 分 类 和 生物 多 样 性 的 保护 起 到 非常 重要 作用 。 建 立 
更 全 面 \ 通 用 的 全 球 植物 DNA 条 码 库 和 开发 新 的 标记 并 采用 新 的 测序 技术 是 植物 DNA 
条 形 码 研究 的 未 来 前 景 。 
关键 词 : 植物 DNA 条 形 码 ， 文 献计 量 学 ， 生 物 多 样 性 ，citespace， 可 视 化 分 析 
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Bibliometric and visualization analysis of DNA barcoding in plants 


XIONG Yong'’*, LI Wenyi', YANG Cui’, 
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(1. School of Ethnic Medicine, Yunnan Minzu University, Kunming 650500, China; 2. College of 
Life and Environmental Sciences, Minzu University of China, Beijing 100081, China) 
Abstract: In order to get the latest information and development researches filed of DNA 
barcoding of plants, and discuss its role in biodiversity conservation. Used bibliometrics, Histcite 
and citespaces to analyze literatures of DNA barcoding in plants based on Web of Sciences 
database to, and analyze Citation counts, research hot and research front visualization. The results 
showed the rate of contribution of literatures was the biggest of Chinese, American, Canadian 
authors. Chinese institutions published literatures counts than others countries, while literatures 
from American and Canadian institutions have more higher quality and influence. This research 
field has gotten peak at 2009 based on citation visualization analysis. The research front and hot 
focus on species identify and biodiversity application, find the suited candidates DNA barcoding 
sequences and refining the identical technology. Chinese authors play a leading role and have 


strength influence at DNA barcoding of plants. Chinese government encourages traditional 
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Chinese medicine industry to promote the development of DNA barcoding technology at China. 
But the quality and influence of published literatures have a gap between China and developed 
countries, Chinese institutions should increase cooperation with the developed countries 
institutions and promote itself research ability. It is very important that DNA barcoding technology 
at species identify and biodiversity conversation. Tomorrow’s Outlook for Plant DNA Barcoding 
is building the global plant DNA barcode library and new DNA markers and new sequencing 
technologies. 
Key words: DNA barcoding of plants, bibliometric, biodiversity, citespace, visualization analysis 

DNA 条 形 码 技术 是 利用 标准 的 基因 片段 对 物种 进行 快速 鉴定 (Hebert et al, 2003), idx 
术 提 供 了 可 信息 化 的 分 类 学 标准 和 有 效 的 分 类 学 手段 , 已 经 被 成 功用 于 生物 物种 鉴定 和 分 类 
(Liu et al, 2011)， 生 物 多 样 性 调查 (Lahaye, 2008) 和 生态 学 研究 (Valentini, 2009) 等 领域 ， 并 成 
为 进展 最 迅速 的 学 科 前 沿 之 一 。 生 命 条 形 码 数据 (BOLD) 系统 提供 了 主要 针对 动物 类 和 群 
DNA 条 形 码 研究 的 技术 规范 ， 由 于 植物 本 身 的 生物 学 特性 与 所 使 用 的 条 形 码 不 同 ， 植 物 
DNA 条 形 码 研究 相对 滞后 些 ， 然 而 其 作为 一 个 DNA 条 形 码 的 研究 领域 重要 内 容 之 一 ， 植 
物 DNA 条 形 码 不 仅 受 到 植物 学 研究 的 影响 ， 又 同时 受到 了 分 子 生物 学 和 生物 信息 学 相互 渗 
透 和 影响 。 DNA 条 形 码 在 植物 中 研究 及 应 用 不 断 增多 ， 2004 年 Blaxter ML 对 DNA 条 形 码 
的 在 分 类 中 应 用 前 景 进行 了 分 析 (Blaxter,2004)，2005 年 Kress WJ 等 利用 DNA 条 形 码 技术 
鉴定 开花 植物 (Kress et al, 2005), 2007 年 Chase MW 提出 关于 陆 生 植物 条 形 码 的 标准 化 方法 
的 建议 (Chase et al, 2007), 2009 年 CBOL Plant Working Group 开展 DNA 条 形 码 技术 在 陆 生 
植物 的 应 用 ，2017 年 Bashir Mohammed Abubakar 对 DNA 条 形 码 在 草药 产品 中 的 鉴定 应 用 
进行 回顾 和 总 结 (Mohammed et al, 2017), DNA 条 形 码 技术 在 植物 上 的 研究 和 应 用 在 源源 不 
断 的 增加 。 

文献 计量 学 是 利用 数学 和 统计 学 方法 来 分 析 相 关 知 识 载体 , 从 而 获取 有 价值 信息 的 一 门 
交叉 学 科 ( 赵 敬 英 , 2010)。 一 个 学 科 或 一 个 研究 领域 的 发 展 情 况 ， 必 然 表现 在 相关 论文 的 发 
表 和 被 引用 方面 ， 因 此 文献 计量 学 可 以 用 于 分 析 、 描 述 学 科 发 展 状况 和 预测 学 科 发 展 趋势 ， 
再 通过 绘制 知识 图 谱 将 结果 以 图 形 的 形式 直观 、 形 象 地 表达 出 来 ( 顾 洪涛 ,2013)， 目 前 用 文 
献计 量 学 对 DNA 条 形 码 在 植物 上 的 研究 领域 总 体 分 析 见 报道 的 不 多 ， 然 而 国内 外 已 经 有 入 
多 基于 Web of Science 数据 库 对 文献 进行 文献 计量 学 统计 分 析 ， 例 如 孙 秀 焕 等 基于 Web of 
Science 分 析 了 水 稻 研究 态势 ( 孙 秀 焕 , 2012)， 杨 华 等 进行 了 国际 茶 多 酚 类 研究 文献 发 展 态势 
研究 ( 杨 华 等 , 2013), Garfield 利用 HistCiter 软件 对 科学 史 进 行 可 视 化 分 析 (\Garfield, 2009 ). 
本 研究 基于 Web of Science 数据 库 ， 对 2003~2016 年 植物 DNA 条 形 码 国际 文献 进行 文献 计 
量 学 统计 和 分 析 ， 再 利用 Histcite 和 Citespace 软件 对 该 研究 领域 进行 了 可 视 化 分 析 ， 达到 对 
植物 DNA 条 形 码 研 究 领域 文献 信息 全 面 了 解 。 


1 .数据 来 源 与 数据 处 理 


1.1 数据 来 源 
以 Web of Science (WoS) 核心 合集 为 数据 来 源 ， 时 间 跨 度 为 2003 一 2016 年 ， 以 CDNA 
barcoding” or “DNA bar coding” or “DNA barcode” or “DNA barcodes”) plant 为 Topic 进行 精确 
检索 ， 下 载 文献 信息 保存 为 纯 文本 文档 ， 为 后 续 分 析 做 准备 。 
1.2 数据 处 理 
1.2.1 Web of Science 文献 处 理 
通过 在 线 http://ip-science.thomsonreuters.com/thanks/histcite/ 网 站 ， 获 得 Histcite 软件 ， 
同时 把 Web of Science 获得 的 文献 信息 整合 为 一 个 完整 的 txt 文档 ， 导 入 Histcite 软件 ， 基 于 
Web of Science 创建 引文 报告 和 分 析 检 索 结 果 以 及 Histcite 统计 ， 分 析 的 内 容 主 要 包括 : 
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年 出 版 的 文献 量 、 被 引 频 次 、 核心 作者 、 出 版 的 期 刊 、 主 要 研究 机 构 和 国家 /地 区 等 (Shadbolt 
et al, 2013; Bharathi, 2013). 
1.2.2 Histcite 文献 处 理 

以 LCS 作为 节点 ， 再 用 其 中 的 Graph maker 制作 引文 编 年 图 ， 探 究 文献 间 的 引用 关系 
及 获得 重要 文献 。 
1.2.3 研究 热点 的 可 视 化 分 析 

将 分 析 后 获得 的 文献 信息 导入 Citespace 软件 中 ， 对 该 领域 研究 热点 、 研 究 前 沿 和 突现 
点 进行 可 视 化 分 析 。 


2. 结果 与 分 析 


用 植物 DNA 条 形 码 为 主题 在 Web of Science 核心 合集 进行 检索 ， 共 获得 检索 结果 1 
097 条 ， 这 些 论文 被 引 频 次 总 计 27 125 次 ， 去 除 自 引 18 922. 
2.1 发 文 量 和 引文 量 分 析 

基于 Web of Science 核心 合集 , 时 间 段 位 2003—2016 4F, LA DNA 条 形 码 为 关键 词 进 
行 检索 ， 用 Web of Science 在 线 工具 进行 引文 报告 分 析 ， 通 过 创建 引文 报告 获得 每 年 文献 量 
和 被 引 频次 (图 1 和 图 2)。 
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图 1 每 年 出 版 的 文献 数 
Fig.1 Published items annually 
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图 2 按 年 份 的 被 引 频 次 


Fig.2 Citation frequencies annually 
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从 图 1 和 图 2 可 以 看 出 每 年 文献 量 从 2003 年 的 个 位 数 篇 到 2016 接近 200 多 篇 ， 文 献 发 
文 量 不 断 增多 ， 每 年 的 被 引 频 次 从 2004 年 0 次 到 2016 年 接近 5 000 次 ， 增 加 的 速率 不 断 加 
大 ， 从 2009 年 后 文献 量 和 论文 被 引用 数量 ， 呈 现 快速 的 增长 ， 表 明 该 研究 领域 稳定 发 展 。 
2.2 论文 被 引 数量 分 析 
对 获得 原始 文档 的 适当 修改 , 导入 Histcite 软件 , 进行 LCS(Local Citation Score ) 和 GCS 
(Global Citation Score) 指标 分 析 (图 3， 图 4)。LCS 是 指 论文 在 本 地 数据 集 (WoS 中 输入 
关键 词 后 导出 的 所 有 文献 ) 中 被 引用 次 数 ，LGS 值 越 高 表示 该 论文 在 该 研究 领域 内 的 重要 
性 高 ，GCS 值 指 论文 在 整个 Wos 数据 中 的 总 被 引 次 数 ， 但 施 引 论文 不 一 定 是 该 领域 内 的 论 
文 。 


图 3 和 图 4 为 2003 年 至 2016 每 年 TLCS(Total Local Citation Score ) 和 TGCS(CTotal Global 
Citation Score) 的 统计 图 。 从 图 中 可 以 看 出 ，TLCS 和 TGCS 都 在 2007 年 至 2012 年 这 几 段 
达到 较 高 水 平 ， 而 后 半 段 2013 年 开始 都 呈 下 降 趋 势 ， 这 种 趋势 与 每 年 的 发 文 量 和 论文 引用 
数量 不 一 致 。TLCS 和 TGCS 在 2009 年 都 达到 了 高 峰 期 ，2009 年 发 的 文献 对 该 领域 研究 具 
有 重要 的 作用 和 很 大 的 影响 力 ， 其 中 CBOL Plant Working Group Hollingsworth ML 等 合作 
发 表 的 论文 《A DNA barcode for land plants》 和 《Selecting barcoding loci for plants: evaluation 
of seven candidate loci with species-level sampling in three divergent groups of land plants》 

(Hollingsworth et al,2009), 前 者 对 现 有 的 7 条 候选 DNA 条 形 码 进行 对 比 , 推 荐 rbcL + matK 
组 合作 为 陆 生 植物 DNA 条 形 码 的 标准 ， 后 者 是 对 陆 生 植物 DNA 条 形 码 提出 了 7 条 候选 序 
列 (atpF-atpH spacer, matK gene, rbcL gene, rpoB gene, rpoCl gene, psbK-psbl spacer, and 
trnH-psbA spacer)， 两 篇 论文 对 后 面 陆 生 植物 DNA 条 形 码 的 研究 起 到 了 指导 性 作用 。 从 
面 的 文献 被 引用 频次 的 可 视 化 分 析 得 出 ， 依 据 TLS 值 获得 排名 前 30 的 论文 ， 其 中 2009 年 
附近 文献 就 有 13 篇 ， 可 见 2009 年 是 植物 DNA 条 形 码 的 研究 的 高 峰 期 和 热点 区 。 
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图 3 每 年 论文 被 引 数 统计 (TLCS) 
Fig. 3 Annual document cited statistics (TLCS) 
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图 4 每 年 论文 被 引 数 统计 (TGCS) 
Fig. 4 Annual document cited statistics (TGCS ) 


2.3 核心 作者 分 析 
把 获得 文献 信息 导入 Histcite 软件 进行 分 析 , 获得 2003—2016 FERRA XKW DNA 条 
形 码 英文 论文 的 作者 有 4 023 位 ， 筛 选 出 发 文 量 前 10 的 作者 〈 表 1)， 其 中 有 5 名 为 中 国学 
者 ， 说 明 中 国 在 这 一 领域 研究 文献 贡献 率 很 大 ， 但 是 从 文献 的 被 引用 频次 上 和 影响 力 上 ， 与 
国外 学 者 有 一 定 的 差距 ， 核 心 作 者 中 是 美国 Smithsonian Institution 的 Kress WJ 的 TLCS 最 
高 ， 其 次 是 加 拿 大 University of Guelph 的 Newmaster SG， 中 国 中 医科 学 院 中 药 研 究 所 陈 士 
林 教 授 在 中 药材 DNA 条 形 码 研究 具有 很 高 的 成 就 ， 所 编写 《中 国药 典 中 药材 DNA 条 形 码 
标准 序列 》 是 该 行业 指导 性 书籍 , 发 文 量 第 二 是 中 国医 学 科学 院 药 用 植物 研究 所 的 宋 经 元 教 
授 ， 在 中 药 DNA 条 形 码 鉴定 研究 中 起 到 领头 羊 的 作用 。 
表 1 论文 数量 前 10 名 学 者 
Table 1 Top 10 authors with most publications 


序号 ”作者 发 文 数 (篇 ) TLCS TGCS 
No. Author Recs 

1 Chen SL 48 634 1 936 
2 Song JY 32 390 1 463 
3 Newmaster SG 29 907 1 928 
4 Yao H 29 305 1 241 
5 Kress WJ 25 1013 2723 
6 Hebert PDN 21 259 2 220 
7 Ragupathy S 18 264 549 

8 Hajibabaei M 17 568 1 488 
9 Li DZ 17 273 571 
10 Pang XH 17 230 1085 


2.4 国家 〈 地 区 ) 和 研究 机 构 分 析 
对 国家 (地 区 ) 和 研究 机 构 文献 量 进行 统计 , 排名 前 10 见 表 2 和 表 3, 从 表 2 可 以 得 出 ， 
发 文 量 前 五 的 国家 都 是 在 DNA 条 形 码 研究 领域 进行 比较 早 或 者 具有 植物 研究 传统 国家 ， 美 


发 展 相对 滞后 或 文化 有 关 ， 但 


献 的 影响 力 和 被 引用 频次 来 看 ，， 


国 和 中 国 发 文 量 最 多 ， 而 且 数 量 相差 不 大 ， 与 其 他 国家 《地 区 ) 相 比 优势 很 明显 , 但 是 从 文 


国 与 美国 、 加 拿 大 和 英国 都 有 差距 ， 可 能 跟 我 们 国家 科技 


技 相 对 发 达 的 国家 和 地 区 ， 


是 从 前 10 名 国家 (地 区 ) 上 看 ， 该 领域 的 研究 主要 集中 在 科 
到 对 该 领域 的 研究 也 有 很 多 成 绩 和 页 献 。 


表 2 发 表 文 献 量 排名 前 10 的 国家 和 地 区 


Table 2 Top 10 Countries/areas based on publications 


序号 ”国家 发 文 数 (篇 ) TLCS TGCS 
No. Country Recs 

1 USA 247 2260 10608 
2 Peoples R China 245 1097 3569 
3 Canada 141 1395 6403 
4 UK 106 1902 5942 
5 India 83 140 746 

6 Germany 66 151 1 752 
7 Italy 64 247 1 466 
8 France 60 437 2 857 
9 Australia 42 68 862 
10 Netherlands 41 76 1475 


表 3 发 文 量 前 10 位 的 机 构 


Table 3 Top 10 institutions based on publications 


序号 ”机 构 发 文 数 (篇 ) TLCS TGCS 
NO. Institution Recs 

1 Chinese Academy of Sciences 105 489 1 458 
2 University of Guelph 69 1218 4390 
3 Chinese Academy of Medical Sciences 61 491 1 233 
4 Smithsonian Institution 45 1078 3 168 
5 Peking Union Medical College 28 117 723 

6 China Academy Chinese Medical Sciences 25 70 329 

7 Royal Botanic Gardens 24 1429 3052 
8 Agriculture and Agri-Food Canada 21 115 990 
9 Natural History Museum 20 575 1512 
10 University of Oslo 18 29 981 


从 表 3 的 研究 机 构 前 十 名 中 ， 可 以 得 出 与 核心 作者 和 国家 相似 的 结果 ， 进 行 植物 DNA 


条 形 码 研究 主要 机 构 


还 是 集中 在 


个 国家 ， 中 国 、 加 拿 大 、 美 国 ， 中 国 科 学 院 发 文 量 最 多 。 


但 是 以 TLCS 为 指标 进行 排序 ( 表 4), 前 三 名 为 英国 Royal Bot Gardens, 加 拿 大 的 University 
of Guelph 和 美国 的 Smithsonian Institution， 前 十 名 研究 机 构 没 有 中 国 研究 机 构 。 因 此 ， 从 发 


文 量 来 看 ， 前 十 名 
且 也 获得 不 错 的 成 果 


有 四 个 中 国 研究 机 构 ， 说 明 我 国有 很 多 学 者 在 进行 植物 DNA 研究 ， 
表 4TLCS 前 10 位 的 机 构 


Table 4 Top 10 institutions based on TLCS 


序号 ”机 构 


No. Institution 


发 文 数 (篇 ) TLCS TGCS 


Recs 


—_ 


Royal Botanic Gardens 24 1429 3052 


2 University of Guelph 69 1218 4390 
3 Smithsonian Institution 45 1078 3 168 
4 New York Botanic Garden 17 702 1 825 
5 University of Johannesburg 14 616 1 132 
6 University Costa Rica 4 606 1117 
7 University of Penn 18 577 2 665 
8 Natural History Museum 20 575 1512 
9 Universidad Nacional Autonoma de Mexico 9 547 1 004 
10 University of Toronto 11 546 1 450 


2.5 核心 期 刊 

对 于 学 术 期 刊 的 发 文 量 与 引文 量 统计 不 仅 可 以 让 我 们 知道 不 同期 刊 在 该 领域 的 影响 力 ， 
也 能 为 学 者 们 选择 目标 期 刊 投稿 与 参考 文献 研究 提供 有 价值 的 参考 依据 ,对 相关 的 期 刊 进行 
分 析 ， 总 共有 338 个 期 刊 发 表 于 植物 DNA 条 形 码 相关 论文 ， 以 发 文 量 进行 排名 ， 前 10 名 
期 刊 见 表 5， 发 表 在 PLOS ONE 期 刊 上 的 文献 量 最 大 ， 其 次 是 MOLECULAR ECOLOGY 
RESOURCES 和 GENOME， 核 心 期 刊 中 大 部 分 都 是 与 分 子 和 系统 进化 相关 ，PLOS ONE 期 
Fi] TLCS 值 为 0， 而 TGCS 值 比较 大 ， 说 明 相 对 而 言 该 期 刊 发 表 的 植物 DNA 条 形 码 领 域 杂 

志 的 影响 力 较 低 ， 但 是 对 于 其 他 领域 研究 发 展 具有 重要 参考 价值 。 
表 5 发 文 量 前 10 的 核心 期 刊 
Table 5 Top 10 of plant DNA barcoding based on records 


序号 “期刊 论文 数 (篇 ) TLCS TGCS 
No. Journal Recs 

1 PLOS ONE 116 0 3 995 
2 MOLECULAR ECOLOGY RESOURCES 71 1002 2528 
3 GENOME 37 12 116 
4 ZOOKEYS 26 28 127 

5 GENETICS AND MOLECULAR RESEARCH 25 25 80 

6 JOURNAL OF SYSTEMATICS AND EVOLUTION 24 248 400 
7 MOLECULAR ECOLOGY 20 55 456 

8 PLANTA MEDICA 20 185 380 

9 ZOOTAXA 20 10 84 

10 TAXON 17 416 658 


表 6 植物 DNA 条 形 码 相关 论文 被 引用 数 前 10 的 期 刊 
Table 6 Top 10 of plant DNA barcoding based on TLCS 


序号 期 刊 论文 数 〈 篇 ) TLCS TGCS 
No. Journal Recs 

1 PROCEEDINGS OF THE NATIONAL ACADEMY OF 10 1549 4335 

SCIENCES OF THE UNITED STATES OF AMERICA 

2 MOLECULAR ECOLOGY RESOURCES 71 1002 2528 
3 TAXON 17 416 658 

4 JOURNAL OF SYSTEMATICS AND EVOLUTION 24 248 400 

5 PLANTA MEDICA 20 185 380 
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6 PHILOSOPHICAL TRANSACTIONS OF THE ROYAL 8 182 327 


SOCIETY B-BIOLOGICAL SCIENCES 
7 CANADIAN JOURNAL OF BOTANY-REVUE 2 152 239 
CANADIENNE DE BOTANIQUE 
8 JOURNAL OF ETHNOPHARMACOLOGY 8 152 279 
9 AMERICAN JOURNAL OF BOTANY 13 141 1 331 
10 TRENDS IN ECOLOGY & EVOLUTION 4 125 365 


2.6 被 引 频 次 的 可 视 化 分 析 


用 HistCite 软件 中 make graph 功能 ， 以 LGS Count 为 条 件 ， 设 节点 为 30， 绘 制 出 植物 


DNA 条 形 码 引文 编 年 图 (图 5) 。 


TT A à 
ee Ny 
ZZ. ogden 


图 5 文献 被 引用 频次 的 可 视 化 分 析 


Figure 5 Visual analyses of ethnoveterinary literatures based on citations 


如 图 5 所 示 ， 从 上 到 下 是 年 份 〈2004 一 2011) ， 箭 头 指向 的 文献 是 被 引用 的 文献 ， 方 


框 内 所 标 数字 是 该 节点 文献 在 所 分 析 文 献 中 的 序号 , 文献 引 


AAA 


] 频 次 越 高 方 框 越 大 , 就 是 该 领 


域 比 较 重要 的 文章 。 图 5 展示 植物 DNA 条 形 码 研究 不 同文 献 之 间 引 证 的 关系 链 ， 文 献 之 间 


关系 紧密 ， 其 中 序号 为 4，5，8，28，48，110 和 326 是 被 引用 频次 较 多 的 文献 ， 这 些 文献 


对 该 领域 的 研究 具有 重要 作用 。 文献 序号 5 和 序号 110 方 框 最 大 , 被 引用 的 频次 最 多 , 文献 
序号 5 是 Kress et al 利用 DNA 条 形 码 技术 鉴定 开花 植物 ， 该 论文 是 较 早 使 用 DNA 条 形 码 


技术 规范 具有 指导 性 的 一 篇 论文 。 从 年 份 我 们 看 出 ，2009 


技术 应 用 于 植物 研究 ， 序 号 110 是 CBOL Plant Working Group 合作 所 写 关 于 DNA 条 形 码 


年 文献 TLS 排名 前 30 最 多 一 年 ， 


是 研究 的 热点 和 高 峰 期 ，2009 年 对 于 植物 DNA 条 形 码 候选 序列 是 一 个 寻找 和 验证 的 时 期 ， 
对 寻找 适合 的 DNA 条 形 码 起 到 了 葛 定 作用 , 而 到 了 2011 年 对 植物 DNA 条 形 码 具有 很 大 发 


E, £ J ITS 序列 (序号 326) (Li et al, 2011) 和 对 现在 
(Hollingsworth, 2011) 。 


民选 序列 的 改善 〈 文 献 序 号 325) 


同时 ， 我 们 也 可 看 出 ， 被 引 频 次 排 在 前 3 位 的 均 是 发 达 国 家 研究 机 构 ， 可 见 DNA 条 形 


码 研究 的 高 质量 和 影响 力 大 的 论文 还 是 集中 在 发 达 的 西方 


国家 研究 机 构 。 植 物 DNA 条 形 码 


候选 序列 文章 一 经 发 表 ， 就 引起 了 相关 学 者 的 广泛 关注 ， 说 明 DNA 条 形 码 技术 的 规范 化 和 


对 候选 序列 的 优选 是 最 前 沿 课题 。 


2.7 热点 分 析 


对 于 一 个 学 科 的 范式 可 视 化 研究 主要 可 分 为 基于 文献 的 共 引 分 析 〈Co-citation ) 和 基于 
词 或 词组 的 共 词 分 析 《〈Co-word) ， 相 较 之 下 共 引 分 析 更 广泛 应 用 于 系统 揭示 学 科 结 构 、 学 
科 的 发 展 规律 和 发 展 趋势 〈 伍 若 梅 ，2010) 。 植 物 DNA 条 形 码 研究 领域 是 一 个 交叉 学 科 ， 


学 科 环 境内 不 同 子 领域 之 间 较 难 有 共 现 的 高 频 关 键 词 , 共 词法 难以 反映 领域 间 知 识 的 输入 输 
出 。 综 合 考虑 ， 本 研究 选择 共 引 法 来 分 析 植 物 DNA 条 形 码 的 学 科 发 展 的 热点 与 前 沿 。 利 用 


Citespace 软件 ， 对 所 得 文献 数据 进行 共 引 分 析 ， 时 区 选择 〈Timespan) A 2003—2016 年 ， 


IN TAI ES PE (Slice Length) 为 1 a, 节点 类 型 选择 “Cited reference”, m fi WE Thresholds (c; 
ce; cev) Co 为 节点 出 现 频次 、cc 为 共同 出 现 频次 、ccy 为 共 现 率 ) 被 设 定 为 (2,2,5; 3,2,10; 
3,3,15) 。 得 出 图 6 和 图 7 两 种 形式 的 聚 类 分 析 图 ， 而 每 个 诊 类 代表 着 该 领域 的 一 个 研究 前 
Wo ANB BE, BPIH S 255 个 点 (每 个 点 代表 一 篇 文献 )，441 条 连 线 ， 其 模 
块 值 (Modularity Q) 为 0.7 108， 轮 廊 值 (Mean Silhouette) W 0.5 633， 表 明 形 成 的 聚 类 结 
构 显 著 、 置 信和 度 高 且 有 意义 。 此 外 ， 采 用 LLR 算法 (对 数 似 然 率 算法 ) 从 施 引 文献 的 关键 
词 (K，Keyword list) 中 提取 名 词性 术语 对 聚 类 进行 命名 (Cluster Labeling) ， 命 名 结果 统 
计 如 表 7。 

从 图 6 中 可 以 得 出 , 出现 大 的 13 个 关键 词 : DNA barcoding, DNA barcode, land plant, 
identification, sequence, taxonomy. diversity. species identification, evolution, phylogeny, 
rbcl plant 和 region， 从 而 把 植物 DNA 条 形 码 研 究 领域 可 以 分 为 13 个 方面 的 聚 类 研究 前 沿 ， 
关键 词 字体 越 大 表示 研究 的 文献 越 多 ， 从 中 我 们 得 出 ，DNA 条 形 码 在 物种 的 鉴定 、 分 类 、 
进化 、 系 统 发 生 、 生 物 多 样 性 和 陆 生 植物 的 应 用 等 具有 重要 的 作用 ， 也 是 该 领域 研究 的 前 沿 
和 热点 。 

表 7 中 显示 不 同 的 聚 类 ，Cluster ID 为 聚 类 后 的 编号 ， 聚 类 的 规模 越 大 《也 就 是 聚 类 中 
包含 的 成 员 数 量 越 多 )， 则 编号 越 小 ，Size 代表 的 是 聚 类 中 所 含有 的 成 员 数 量 ，Silhouette 为 
衡量 真 个 聚 类 成 员 同 质 性 性 指标 , 该 数值 越 大 , 则 代表 该 聚 类 成 员 的 相似 性 越 高 , Mean year 
代表 的 事 该 聚 类 中 文献 的 平均 年 份 ， 判 断 聚 类 中 引用 文献 的 远近 ， 表 7 只 列 出 聚 类 
LLR(likelihood Rate) 前 10 名 。 

综合 分 析 图 6 和 图 7 以 及 表 7， 同 时 参考 聚 类 中 的 施 引 文献 ,我们 可 以 大 致 了 解 到 每 个 
聚 类 所 代表 的 的 研究 前 沿 。 表 7 内 一 共 总 结 了 前 10 大 植物 DNA 条 形 码 的 研究 前 沿 ， 主 要 
的 几 个 聚 类 如 下 : 

RA 0 主要 关注 的 是 用 植物 DNA 条 形 码 的 方法 对 一 些 难 于 鉴定 的 样品 进行 鉴定 ， 如 对 
食 草 动物 (家 畜 和 野生 动物 ) 的 排泄 来 鉴定 动物 的 饮食 成 分 ， 代 表 论 文 《Universal DNA-Based 
Methods for Assessing the Diet of Grazing Livestock and Wildlife from Feces》 (Pegard et al, 
2009) . RX 1 主要 关注 的 是 核糖 体 DNA (ITS 序列 ) , 在 植物 多 样 性 上 的 应 用 ,《Confirming 
the Genetic Identity of Dendrobium fimbriatum Using an Amplification Refractory Mutation 
System (ARMS)》 (Lu etal, 2010) . 22 利用 DNA 条 形 码 对 不 同 物种 进行 快速 的 鉴定 
方法 ， 如 在 真菌 鉴定 中 的 应 用 ，《Current state and perspectives of fungal DNA barcoding and 
rapid identification procedures》(Begerow et al, 2010). R2 3 DNA 条 形 码 在 不 同 地 区 药 用 植 
物 的 应 用 , 如 在 土耳其 山区 对 当地 药 用 植物 的 应 用 ,《DNA barcoding study on sideritis trojana 
bornm. an endemic medicinal plant of ida mountain, turkey} (Tezcan, 2010)。 聚 类 4 主要 关注 
DNA 条 形 码 在 植物 进化 、 生 物 信息 学 和 资源 上 的 应 用 , 主要 的 论文 《4DNA barcoding in plants: 
evolution and applications of in silico approaches and resources} (Bhargava, 2013). R25 主要 
关注 的 是 DNA 条 形 码 在 各 个 科 分 类 鉴定 中 的 应 用 ， 如 《DNA barcoding of Orchidaceae in 
Korea) (Kim et al, 2014). RK 6 利用 核 DNA 和 叶绿体 DNA 的 方法 对 物种 进行 鉴定 ， 

《Species identification of Alnus(Betulaceae) using nrDNA and cpDNA genetic markers》 (Ren, 
2010)。 
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图 6 2003—2016 年 植物 DNA 条 形 码 研 究 前 沿 (Cluster view) 
Fig.6 Research front DNA barcoding in plants from 2003 to 2016(Cluster view) 
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图 7 2003—2016 年 植物 DNA 条 形 码 研究 前 治 〈Timeline view) 
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Fig.7 Research front of DNA barcoding in plants from 2003 to 2016(Timeline view) 


#27 前 10 个 的 LLR 标签 
Table 7 Top 10 of LLR 


BKK O WAT A 
Tr PHE l 
大 小 FORME 对 数 似 然 率 算法 
Cluster ear 
Size Silhouette LLR 
ID (mean) 
Sheep, diet analysis, polymerase, pyrosequencing, herbivore, herbivory, 
0 30 0.776 2010 i . . 
botanical composition, grass, conservation 
nuclear ribosomal dna, united states, phylogeny, sequence analysis, psba 
1 23 0.809 2011 . . 
trnh, long distance dispersal, seed, apiaceae, gene flow, polymorphism 
biological control , parasitoid, resprouter ,,south africa, esolution melting 
2 22 0.695 2011 oe es | 
analysis , infection phylogenetic diversity, biodiversity hotspot 
land plant, taxonomy, identify, specimen ,trnh psba, sample, sideritis 
3 21 0.787 2010 . . . 
trojana, life, temperature, psba trnh intergenic region 
software ribosomal rna ,bioinformatics , tool,database,food 
4 18 0.619 2013 . . . . 
web,microbial community , resistance,population structure ,land plant 
orchidaceae, genome sequence ,araceae , gene sequence, root rot, size 
3 18 0.596 2011 i 
homoplasy, nucleotide sequence 
medicinal plant, region, leave, quality control, qinghai tibetan 
6 18 0.786 2013 . “puta a 
plateau,plant dna barcoding, variability, spacer, phylogenetic inference 
Lepidoptera, cryptic diversity, tachinidae , moth, parasitoid flies diptera, 
7 17 0.709 2010 . . . . . . 
population genetic structure, glacial refugia, genetics , high mountain 
honey, diet, bee, species richness, system, community ecology, 
8 17 0.767 2013 D in 
aes biodiversity, dry grassland, calcareous grassland, food traceability 
green algae, tufa, molecular phylogeny, nucleotide sequence data, series 
9 15 0.901 2010 人 
gymnobasalia, secondary structure, chlorophyta 
2 polymerase chain reaction, mitochondrial dna, dna taxonomy, sequence 
tage 10 15 0.814 2007 


data, community structure, international species databank, bold, 


= 从 图 8 中 可 以 得 出 ，2003 一 2016 年 这 段 时 间 植 物 DNA 条 形 码 在 某 一 时 段 的 研究 突破 点 
£ 或 者 转折 点 ， 突 现 的 引文 节点 用 红色 表示 。 从 图 中 可 以 ，23 个 主要 的 关键 词 中 得 出 最 大 的 

节点 是 2008 一 2011 年 的 鉴定 〈identify) 关键 词 ， 最 小 为 2007 年 至 2009 年 的 生命 Aife) X 
键 词 。DNA 条 形 码 利用 标准 的 基因 片段 对 物种 进行 快速 鉴定 是 研究 的 前 沿 ， 也 是 DNA 条 
码 的 主要 作用 和 价值 ， 结 合 前 面 的 每 年 论文 被 引 数 统计 和 被 引 频 次 的 可 视 化 分 析 ， 可 知 
2008~2011 是 DNA 条 形 码 领域 研究 的 高 峰 期 和 热点 区 , 对 该 领域 的 具有 巨大 的 影响 和 贡献 。 
3. 讨 论 

本 研究 通过 Web of Science 数据 库 对 DNA 条 形 码 进行 检索 ， 基 于 文献 计量 学 方法 ， 从 每 
年 出 版 的 文献 量 、 被 引 频次 、 核 心 作者 、 出 版 的 期 刊 、 主 要 研究 机 构 和 国家 /地 区 、 研 究 热 
点 进行 了 较 全 面 的 计量 分 析 ， 并 对 被 引 频次 、 研 究 前 沿 进行 了 可 视 化 分 析 。 

(1) 在 国家 /地 区 分 布 方面 ， 美 国 、 中 国 、 加 拿 大 论文 产 出 数量 最 多 ， 但 是 从 文献 的 影 
响 力 和 被 引用 频次 来 看 , 中 国 与 美国 加拿大 和 英国 都 有 一 定 的 差距 。(2 ) 在 研究 机 构 方面 ， 
优秀 的 水 稻 研究 机 构 集 中 在 中 国 和 美国 , 在 发 文 量 前 三 名 有 机 构 有 两 个 是 中 国 研究 机 构 , 但 
在 影响 力 上 〈TLCS )， 中 国 的 研究 机 构 没有 排 在 前 十 名 ， 中 国 科 研 机 构 在 提高 自身 论文 水 平 
的 同时 ， 还 应 注意 加 强 与 美国 和 其 他 国家 优秀 科研 机 构 的 交流 与 合作 ， 提 高 自身 论文 水 平 。 
(3) 在 论文 作者 方面 ， 发 文 量 、 总 被 引 频 次 ， 主 要 集中 在 美国 、 中 国 、 英 国 和 加 拿 大 ， 发 
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文 量 前 10 的 作者 ( 表 1)， 其 中 有 5 名 为 中 国学 者 ， 说 明 中 国 在 这 一 领域 研究 文献 贡献 率 很 
K, 但 是 影响 力 与 欧美 国家 的 学 者 ， 还 有 一 定 的 距离 。(4) 在 论文 期 刊 分 布 上 ， 优 秀 期 刊 主 
要 集中 在 美国 、 英 国 、 加 拿 大 等 欧美 国家 , 没有 中 国 的 英文 期 刊 ， 通 过 对 被 引 频次 的 可 视 化 
分 析 ， 可 以 看 出 DNA 条 形 码 候 选 序列 第 选 和 技术 的 应 用 是 该 领域 最 大 关注 点 。(5) DNA 
条 形 码 研 究 热 点 集中 DNA 条 形 码 在 陆 生 植物 、 物 种 鉴定 、 分 类 、 生 物 多 样 性 、 候 选 序列 得 
选 、 系 统 进 化 上 的 应 用 等 方面 。 

Top 23 Keywords with the Strongest Citation Bursts 


Keywords Year Strength Begin End 2003 - 2016 
mitochondrial dna 2003 4.3013 2003 2007 mmama 
sequence 2003 4.2498 2006 2007 om e es ss er mm 
population 2003 3.2668 2006 2009 一 一 一 mmmmmmm 一 一 一 一 一 一 一 
flowering plant 2003 3.119 2097 2009 seame 
life 2003 2.9422 2007 2009 aane 
identify 2003 7.8714 2008 2011 oo 
hybridization 2003 3.7335 2008 2009 see 


astraptes fulgerator 2003 3.2659 ZOOS 201l ne ee ee ee A cc ee 
molecular evolution 2003 3.0336 2008 2009 om se se ss 
molecular systematics 2003 3.0336 ZOOS AO.. ne cece sees me I RN mss ss 
parasitoid flies diptera 2003 3.9314 2009 2011 mm m ee es ee HN NN I se es ee 


noncoding region 2003 3.4957 ZOOS 2021 ace ee ees es ee es A ce ees ees es es 
landplant 2003 3.3019 2009 2010 一 一 一 一 一 一 mm 一 一 一 一 一 一 
genus 2003 2.9842 2009 2010 see eee 
secondary structure 2003 4.0905 2010 2012 mss e meer ser a WE HN I ss a 
complement 2003 4.0905 2010 2012 ce cee ee ee eres ce mes ce es es 
plastid genome 2003 2.9724 2010 2011 oo es sss 
mitochondrial 2003 4.5093 20 2012 aan 
genetics 2003 3.0934 2011 2012 zaa 
spacer 2003 3.3361 2012 2014 nsss eee mes eee ss DD ese 
maximum likelihood 2003 5.0695 2013 2016 一 一 一 一 一 一 一 一 一 一 mmmmmmmm 
dnabarcode 2003 3.13 2013 2014 aama 
china 2003 3.1659 2014 2016 si 


8 2003—2016 年 植物 DNA 条 形 码 不 同时 期 的 研究 突现 点 
Fig. 8 Citation burst of DNA barcoding in plants from 2003 to 2016 

近 10 多 年 来 , FE DNA 条 形 码 研究 论文 数量 一 直 处 于 上 升 态势 , 发 文 量 居 世界 第 二 ， 
但 论文 影响 力 有 限 。 中国 科学 院 、 中 国 中 医科 学 院 、 中 国医 学 科学 院 与 北京 协和 医学 院 是 中 
国 优秀 的 DNA 条 码 科 机 构 , 陈 士 林 和 宋 经 元 的 文献 较 多 , 质量 较 高 。 在 SCI 收录 的 期 刊 P, 
中 国 没有 DNA 条 形 码 研究 领域 的 优秀 期 刊 ， 在 影响 力 较 高 10 篇 CLCS) 的 论文 中 有 中 国 
科学 院 昆 明 植 物 研 究 所 李 德 珠 、 高 连 明 等 中 国 植物 条 形 码 研究 团队 (China Plant BOL Group) 
合作 的 论文 《Comparative analysis of a large dataset indicates that internal transcribed spacer 
(ITS) should be incorporated into the core barcode for seed plants) (Li et al, 2011). 

虽然 我 国 开展 DNA 条 形 码 的 研究 起 步 较 晚 ， 特 别 是 植物 DNA 条 形 码 的 研究 到 2008 
年 才 真 正 开 始 ， 但 发 展 十 分 迅 独 ， 发 表 了 系列 的 相关 文章 ， 并 参与 了 国际 植物 核心 DNA 条 
形 码 的 评估 与 推荐 , 相信 不 久 的 将 来 我 国 在 国际 生命 条 形 码 研究 中 会 发 挥 更 大 的 作用 。 从 我 


国 国务 院 发 布 的 《中 医药 发 展 战 略 规划 纲要 (2016—2030 4), DNA 条 形 码 在 中 药 的 应 用 
将 会 不 断 增 多 ， 目 前 已 经 获得 了 不 少 的 成 果 , 《中药 DNA 条 形 码 分 子 鉴定 》《 中 国药 典 中 
药材 DNA 条 形 码 标准 序列 入 中 药材 DNA 条 形 码 鉴定 系统 (http:Wwww.tcmbarcode.cn/china/ )， 
DNA 条 形 码 将 会 为 中 药 的 鉴定 ， 中 药 将 走出 国门 , 被 世界 接纳 英 定 基础 ,， 中国 植物 DNA 条 
区 码 研究 也 是 蒸蒸日上 ， 中 国 科学 院 昆 明 植 物 研究 所 和 中 国 科 学 院 华南 植物 园 共同 完成 的 
“中 国 植物 DNA 条 形 码 研究 ”科技 研究 已 经 获得 不 错 的 成 果 。 
植物 DNA 条 形 码 2017 年 文献 动态 及 发 展 前 景 ， 在 前 面 的 数据 分 析 中 没有 涉及 到 2017 

年 的 文献 数据 ，Web of Science 核心 合集 中 对 2017 年 植物 DNA 条 形 码 进行 文献 检索 分 析 ， 
获得 208 个 记录 ， 该 领域 研究 于 勃发 展 ， 文 献 量 均 高 于 其 他 年 份 ， 中 国 和 美国 发 文 量 占 了 
将 近 50% (103 篇 )， 主 要 的 发 文 期 刊 和 作者 与 前 面 的 结果 一 致 ， 主 要 文献 为 Plant DNA 
barcodes: applications today and in the future (Kress, 2017). 2017 年 延续 了 前 期 的 研究 ， 并 
重点 开展 了 以 下 几 个 方面 研究 : 群落 系统 发 育 和 物种 编目 ， 功 能 形状 和 物种 的 编目 ， 物 种 之 
间 的 互相 影响 : 识别 未 知 的 物种 ， 物 种 的 边界 和 生物 多 样 性 的 发 现 ，DNA 条 形 码 的 取证 : 
商业 产品 、 濒危 物 种 、 草 药 的 原材料 、 民 族 植物 学 ， 物 种 和 栖息 地 的 保护 。 同 时 某 些 在 特定 
的 植物 (Codonopsis) 群 中 , 仍然 可 以 看 到 各 种 各 样 的 DNA 条 形 码 标记 测试 的 研究 报告 (Wang 
et al, 2017). 
自从 十 多 年 前 DNA 条 码 被 引入 到 植物 群落 ，DNA 条 码 在 植物 基础 研究 和 应 用 研究 中 
都 得 到 了 广泛 的 应 用 。 植 物 系 统 学 家 尚未 普遍 接受 DNA 条 码 作为 识别 物种 的 核心 工具 的 
个 主要 原因 是 ,在 大 多 数 分 类 群 中 ,没有 一 个 标记 能 够 完全 区 分 物种 。 相 比 之 下 ， 生 态 学 家 
更 愿意 寻找 新 的 、 独特 的 DNA 条 码 应 用 , 以 解决 他 们 的 一 些 基 本 研究 问题 , 因为 总 的 来 说 ， 
他 们 在 由 多 种 植物 谱系 组 成 的 系统 中 工作 ， 这 些 系统 可 以 通过 DNA 条 码 位 点 的 组 合 进 行 唯 
一 的 识别 。 展 望 未 来 ， 植 物 DNA 条 码 将 通过 两 种 关键 的 方式 为 植物 群落 服务 : 1) 建立 一 
个 更 全 面 、 通 用 的 全 球 植物 DNA 条 码 库 。 实 现 为 世界 上 所 有 植物 提供 DNA 条 码 的 通用 库 
的 目标 仍然 是 遥远 的 未 来 ， 但 是 一 旦 实现 ， 基 础 研究 和 应 用 研究 都 将 受益 菲 浅 。2) 开发 新 
的 标记 并 采用 新 的 测序 技术 ， 如 DNA 宏 条 形 码 (metabarcoding 或 eDNA) (Taberlet et al, 
2012), 随 着 测序 技术 的 提高 和 费用 的 降低 , DNA 条 形 码 向 基因 组 学 方向 发 展 (Coissac et al, 
2016). 
在 此 次 分 析 中 ， 存 在 以 下 几 方 面 的 不 足 : (1) 用 HistCite 软件 以 LGS Count 为 条 件 ， 选 
J LCS 绘制 引文 编 年 图 ， 有 时 候 一 些 新 的 文章 因为 年 代 近 ， 被 引用 次 数 暂 时 还 不 多 ， 所 以 
它们 在 图 中 节点 中 被 引用 次 数 不 会 很 多 ， 也 存在 一 定 的 缺陷 ， 有 些 近 期 的 论文 很 重要 , 但 是 
没有 表现 出 来 。(2) 基于 Web of Sciences 数据 库 涵盖 了 多 种 世界 范围 内 最 有 影响 力 的 高 质 
量 英 文 期 刊 , 但 其 侧重 于 收录 母语 为 英语 地 区 的 期 刊 , 来 源 期 刊 地 域 分 布 的 不 平衡 性 对 分 析 
结果 有 一 定 的 影响 。 
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